Teoria de Juegos 



Teona de Juegos 


"La teoiia de juegos es el estudio matematico de la 
interaction entre agentes independientes y 'auto- 
interesados"'. Asi lo define el libro Essentials of Game 
Theory: A concise, multidisciplinary introduction, de Kevin 
Leyton-Brown y Yoav Shoham, 2008, un texto que se usa 
en la Universidad de Stanford para apoyar algunos cursos y 
que voy a citar en algunos comentarios posteriores. 

http://www.gtessentials.org/resources.html 


Teona de Juegos 


El texto fundacional de la disciplina es: 

Theory Of Games And Economic Behavior (1944) 

Authors: Neumann, John Von and Morgenstern, Oskar 
Publisher: Princeton University Press. 

Language: English 

que pueden descargar desde aca: 

http://archive.org/details/theoryofgamesand030098mbp 

http://cesimo.ing.ula.ve/~jacinto/abiertos/teoria-de-juegos-cap-01-a.pdf 

http://cesimo.ing.ula.ve/~jacinto/abiertos/teoria-de-juegos-cap-01-b.pdf 


Theory Of Games And Economic Behavior (1944) 

(traducido por Jacinto Davila) 


“Seccion 2.1.1 (segundo parrafo) Las dificultades practicas y conceptuales de 
la nocion de utilidad, y particularmente de los intentos de describirla como un 
numero, son bien conocidas y su tratamiento no esta entre los objetivos 
primarios de este trabajo. Nos veremos forzados, no obstante, a discutirlos en 
algunos casos, particularmente en 3.3 y 3.5 

[...] Asumiremos por tanto que el objetivo de todos los participantes en el 
sistema economico, tanto consumidores como emprendedores, es el dinero, o 
en forma equivalente, un mismo bien economico. Este se supone divisible sin 
restricciones y sustituible, libremente transferible e identico, incluso en el 
sentido cualitativo, con cualquier “satisfaccion” o “utilidad” que desee cada 
participante. 

Seccion 2.1.2. El individuo que intenta obtener esos respectivos maximos se 
dice tambien que actua “racionalmente”. “ 



Theory Of Games And Economic Behavior (1944) 

(traducido por Jacinto Davila) 


“2.2.2. A Crusoe le son dados ciertos datos ffsicos (deseos y bienes 
elementales) y su tarea es combinarlos y aplicarlos de tal forma que 
obtenga una satisfaccion resultante maxima. No puede haber duda de 
que el controla exclusivamente todas las variables de las que depende 
ese resultado - sea la asignacion de recursos, la determinacion de los 
usos del mismo artfculo para diferentes deseos, etc. (2). 

Asf que Crusoe se enfrenta con el problema ordinario de 
maximization, cuyas dificultades son de naturaleza tecnica - y no 
conceptual - como se ha dicho. 

(2) Algunas veces tambien intervienen factores incontrolables, e.g. el 
clima en la agricultura. Estos, sin embargo, son fenomenos puramente 
estadfsticos. En consecuencia se les puede eliminar con el conocido 
procedimiento del calculo de probabilidades, es decir, determinando las 
probabilidades de las diversas alternativas e introduciendo la notion de 
“expectativa matematica”.” 



Theory Of Games And Economic Behavior (1944) 

(traducido por Jacinto Davila) 


“2.2.3 Considere ahora un participante en una economia social. Su problema 
tiene, por supuesto, muchos elementos en comun con un problema de 
maximizacion. Pero tambien contiene algunos elementos esenciales de una 
naturaleza completamente diferente. El tambien trata de obtener un resultado 
optimo. Pero para obtenerlo, debe entrar en relaciones de intercambio con 
otros. Si dos o mas personas intercambian bienes entonces el resultado para 
cada una dependera, en general, no unicamente de sus propias acciones sino 
de las de los otros tambien. De manera que cada participante intenta 
maximizar una funcion (su “resultado”) en las que no controla todas las 
variables. Ciertamente, este no es un problema de maximizacion, sino una 
mezcla peculiar y desconcertante de varios problemas de maximizacion en 
conflicto entre ellos. Cada participante esta guiado por otro principio y ninguno 
determina todas las variables que afectan sus intereses.” 



Theory Of Games And Economic Behavior (1944) 

(traducido por Jacinto Davila) 


“Este tipo de problema no es resuelto para nada en la matematica clasica. 
Enfatizamos, al riesgo de ser pedantes, que este no es una problema de 
maximizacion condicional, ni un problema del calculo de variaciones, o del 
analisis funcional o algun otro. Surge con toda claridad, incluso en las mas 
“elementales” situaciones e.g. cuando todas las variables pueden asumir solo 
un conjunto finito de valores. 

Una particularmente aguda expresion de la confusion popular acerca de este 
pseudo-problema de maximizacion es la famosa declaracion de acuerdo a la 
cual el proposito del esfuerzo social es el “mayor beneficio posible para el 
mayor numero posible”. Un principio guia no puede ser formulado con el 
requerimiento de maximizar dos (o mas) funciones al mismo tiempo. 

Tal principio, literalmente, es autocontradictorio (en general, una funcion no 
tendra un maximo donde la otra lo tenga). No es mejor que decir, e.g., que 
una firma debe obtener precios maximos con el maximo ingreso, o el maximo 
beneficio con la minima produccion. Si algun orden de importancia de estos 
principios o promedio ponderado se pretende, se debe declarar. Sin embargo, 
en la situacion de los participantes en una economia social, nada de eso se 
pretende, sino que todos los maximos se desean al mismo tiempo - por todos 
los participantes. “ 



Theory Of Games And Economic Behavior (1944) 

(traducido por Jacinto Davila) 

“Uno se equivocarfa si cree que esto puede se obviado, como la 
dificultad de Crusoe descrita en (2), recurriendo simplemente a los 
recursos de la teorfa de la probabilidad. Cada participante puede 
determinar las variables que describen sus propias acciones pero no 
las de otros. Sin embargo, esas variables “extranjeras” no pueden ser, 
desde su punto de vista, descritas por suposiciones estadfsticas. Esto 
es debido a que los otros son guiados, tal como el mismo, por 
principios racionales - sea lo que sea lo que esto signifique - y ningun 
modus procedendi puede estar bien si no intenta entender esos 
principios y las interacciones de los intereses conflictivos de todos los 
participantes. 

Algunas veces esos intereses van mas o menos de la mano - 
entonces estamos mas cerca a un problema de maximizacion simple. 
Pero tambien pueden oponerse. Una teorfa general debe cubrir todas 
estas posibilidades, todos las etapas intermedias y todas sus 
combinaciones” 



Theory Of Games And Economic Behavior (1944) 

(traducido por Jacinto Davila) 


“2.2.4. La diferencia entre la perspectiva de Crusoe y la de un 
participante en una economfa social puede ser ilustrada tambien de 
esta manera: Aparte de esas variables que el controlara, a Crusoe le 
es dada una cantidad de datos que estan “muertos"; son un soporte 
ffsico inalterable de la situacion (incluso cuando son aparentemente 
variables, como se dice en (2) y estan gobernados por leyes 
estadfsticas fijas). Ni un solo dato que le es dado tiene que dar cuenta 
de la voluntad o intencion economica de alguna otra persona - 
basandose en motivos economicos como lo suyos. Un participante en 
una economfa de intercambio social, por otro lado, se enfrenta tambien 
a datos de este tipo: son el resultado de la acciones y voluntades de 
los otros participantes (como los precios). Sus acciones estaran 
influenciadas por sus expectativas y estas, a su vez, reflejan las 
expectativas de los otros participantes respecto a sus acciones. “ 



Theory Of Games And Economic Behavior (1944) 

(traducido por Jacinto Davila) 


“Asf que el estudio de la economfa de Crusoe y el uso de metodos que 
se apliquen a ella es de un valor mucho mas limitado para la teorfa 
economica que lo que se ha crefdo hasta ahora, incluso por los crfticos 
mas radicales. Las razones de estas limitaciones descansan no en el 
campo de esas relaciones sociales que hemos mencionado antes - 
aun cuando no cuestionamos su importancia - sino que surgen de las 
diferencias conceptuales entre el problema de maximizacion original 
(de Crusoe) y el problema mas complejo que se bosquejo aquf. 

Confiamos que el lector quede convencido por este texto que ahora y 
aca enfrentamos una dificultad realmente conceptual - y no 
meramente tecnica. Y es para enfrentar este problema para lo que se 
disena la teorfa de “juegos de estrategia”. 



El dilema del prisionero 



Formalizando el iuego 


Juego = (Agentes, Acciones, Resultados) 

Agente = (Metas, Creencias, Observaciones, 

Acciones) 



Essentials of Game Theory: A concise, multidisciplinary 
introduction, de Kevin Leyton-Brown y Yoav Shoham, 2008 


Definition 1,2.1 (Normal-form game). A (finite, n -person) normal-form game is a 
tuple (N, A, u), where: 

• N is a finite set ofn players, indexed by i; 

• A = Ai x x 4, where A, is a finite set of actions available to player i, 

Each vector a = (a u aj e A is called an action profile; 

• u = (iii, uj where u,: A i-> R is a real-valued utility (or payoff) function 
for player i. 


La esencia del dilema del prisionero 


C D 

C 

D 

Any c > a > d > b define an instance of Prisoner's Dilemma. 


a, a 

b,c 

c, b 

d, d 


Respuestas al dilema 


“[La teorfa de juegos] nos dice que cualquier usuario racional que 
se enfrenta con ese escenario una vez optara por D sin importar 
lo que el otro agente haga. Nos dice que permitir a los usuarios 
comunicarse por adelantado no cambiara el resultado. Nos dicen 
que con agentes perfectamente racionales, la decision seguira 
siendo la misma incluso si juegan muchas veces; Sin embargo, si 
el numero de veces que los agentes van a jugar es infinito o 
incierto, puede que adopten C. ’’[Kevin Leyton-Brown y Yoav 
Shoham, 2008] 



Juegos de Coordination 
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Piedra, Papel o Tiiera 
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Batalla de los sexos 


Husband 
LW WL 





De acciones a estrategias 


Una estrategia pura es seleccionar una accion 

particular yjugarla. 

La seleccion de una estrategia pura para cada 
agente es un perfil de estrategias puras 



De acciones a estrategias 


Una estrategia mixta o combinada es 

seleccionar una accion del conjunto posible 
siguiendo alguna distribution de probabilidad 



Estrategias mixtas, perfiles y 

soportes 


Definition 1.4.1 (Mixed strategy). Let ( N , A, u) be a normal-form game, and for any 
set X let U(X) be the set of all probability distributions over X. Then the set of mixed 
strategies for player i is S, = n(A,). 

Definition 1.4.2 (Mixed-strategy profile). The set of mixed-strategy profiles is 
simply the Cartesian product of the individual mixed -strategy sets, S, x • • • x S„. 

By s,{a,) we denote the probability that an action a , will be played under mixed 
strategy s,. The subset of actions that are assigned positive probability by the mixed 
strategy s, is called the support of s,. 

Definition 1.4.3 (Support). The support of a mixed strategy s,for a player i is the set 
of pure strategies {a,|s,(< 2 /) > 0}. 


Utilidad esperada de una estrategia mixta 


Definition 1.4.4 (Expected utility of a mixed strategy). Given a normal-form game 
( N,A , u), the expected utility u, for player i of the mixed -strategy profile s = (s„ s n ) is 
defined as 


n 

u i(s) = y^uMUsAaA 

at A j= 1 


Eiemplos locales 


Gobierno aumenta 
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definitiva) 
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El juego por el conocimiento 

Jacinto Davila <jacinto@ula.ve> version a 1.0 




Abierto 
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Entre optimalidad y equilibrio 


Una estrategia optima es una que maximice el beneficio esperado del 
agente en el ambiente en el que opera. En el contexto multiagente, sin 
embargo, este problema se torna complejo porque los otros agentes en 
el juego tambien estan tratando de maximizar sus beneficios. Asf que 
hablar de una estrategia optima para un agente no tiene sentido. 

Los teoricos de juegos hablan, en lugar de ese concepto, de formas 
para seleccionar ciertos subconjuntos de resultados a los que 
denominan conceptos solucion. Dos de los conceptos solucion mas 
importantes son 


La optimalidad de Paremo 
El equilibro de Nash 



Dominacion y optimalidad de Pareto 


Definition 2.1.1 (Pareto domination). Strategy profile s Pareto dominates strategy 
profile s' if for all i e N, u,(s) > u,{s'), and there exists some jeN for which u/s) > u/ s'). 


Definition 2.1.2 (Pareto optimality). Strategy profile s is Pareto optimal, or strictly 
Pareto efficient, if there does not exist another strategy profile s' e S that Pareto 
dominates s. 


Sobre la optimalidad de Pareto 


1. - Todo juego debe tener al menos un perfil de 
estrategias optimo de Pareto, y debe haber 
siempre al menos uno de esos optimos en el 
que todos los jugadores adopten estrategias 

puras. 

2. - Algunos juegos tendras varios optimos. En 
juegos de suma cero, por ejemplo, todos los 

perfiles de estrategias son estrictamente Pareto- 

eficientes 



Equilibro de Nash 

Mirando el juego desde la perspectiva de uno de 

los agentes ( i los demas son -i ) 


Definition 2,2,1 (Best response), Player i's best response to the strategy profile s., is 
a mixed strategy s* e S, such that u,(s* sj > u,(s lV s.,) for all strategies s i e S,. 


Pero este NO es un concepto solucion 


Equilibrio de Nash 


Definition 2.2.2 (Nash equilibrium). A strategy profile s = (s„ sj is a Nash 
equilibrium if for all agents i, s, is a best response to s.,. 

Definition 2.2.3 (Strict Nash). A strategy profile s = (s„ s„) is a if for all agents i 

and for all strategies s', * s„ i/,(s„ s_,) > u,(s'„ s_,). 

Definition 2.2.4 (Weak Nash). A strategy profile s = (s„ sj is a if for all agents i 
and for all strategies s', * s„ u,(s„ s_,} > u,(s'„ s.J, and s is not a strict Nash equilibrium. 


Equilibrio de Nash 


Definition 2.2.2 (Nash equilibrium). A strategy profile s = (s„ sj is a Nash 
equilibrium if for all agents i, s, is a best response to s.,. 

Definition 2.2.3 (Strict Nash). A strategy profile s = (s„ s„) is a if for all agents i 

and for all strategies s', * s„ i/,(s„ s_,) > u,(s'„ s_,). 

Definition 2.2.4 (Weak Nash). A strategy profile s = (s„ sj is a if for all agents i 
and for all strategies s', * s„ u,(s„ s_,} > u,(s'„ s.J, and s is not a strict Nash equilibrium. 


